iT邦幫忙

2023 iThome 鐵人賽

DAY 6
0
AI & Data

夥伴們!一起航向AWS Certified Machine Learning Specialty的偉大航道吧!系列 第 6

Day 6 第一站 Data Engineering - Data Stores for Machine Learning

  • 分享至 

  • xImage
  •  

Machine Learning的資料儲存服務,除了第二天所提到的S3服務以外,還有其他另外五種,這邊也跟大家進一步的分享和比較之間的差別。

1. S3
採Serverless機制運作,有無限的儲存空間可以存放Ojbect Files(各種檔案都可以直接上傳),並可跟許多AWS運算與機器學習服務串接。
2. Redshift
可用於Data Warehousing與OLAP(Online Analytical Processing)服務。
3. Dynamo DB
屬於NoSQL資料庫,可用來儲存訓練好的模型檔案。由於模型的儲存有各種格式,正好適合Dynamo DB這種NoSQL富有彈性的資料定義與儲存結構。背後資源是採用Serverless機制運行,自動做好資源調配。
4. RDS/AURORA
結構化的資料可使用關聯式資料庫來做儲存。用於OLTP(Online Transaction Processing)服務。缺點是需要事先做好機器的資源配置。
5. Open Search(Elastic Search)
所存資料可用於資料檢索用。
6. Elastic Cache
僅供Machine Learning服務的資料暫存之用。


接著我們透過ChatGPT來幫大家出題目和複習一下內容吧!

ChatGPT來出題囉:

以下是三道選擇題以及各自的解答:

問題1:哪種資料儲存服務採用Serverless機制運作,並且有無限的儲存空間可以存放Object Files,可與許多AWS運算與機器學習服務串接?

A. Redshift
B. Dynamo DB
C. S3

答案:C. S3

解答1:S3是採用Serverless機制運作的資料儲存服務,並具有無限的儲存空間,可存放Object Files,也可與許多AWS運算與機器學習服務進行串接。

問題2:哪種資料儲存服務可用於Data Warehousing與OLAP(Online Analytical Processing)服務?

A. RDS/AURORA
B. Elastic Cache
C. Redshift

答案:C. Redshift

解答2:Redshift是可用於Data Warehousing與OLAP服務的資料儲存服務。

問題3:哪種資料儲存服務適合用來儲存訓練好的模型檔案,背後採用Serverless機制運行,自動做好資源調配?

A. Dynamo DB
B. S3
C. Elastic Cache

答案:A. Dynamo DB

解答3:Dynamo DB是一個NoSQL資料庫,適合儲存訓練好的模型檔案,並且背後採用Serverless機制運行,自動做好資源調配。


上一篇
Day 5 第一站 Data Engineering - Glue
下一篇
Day 7 第一站 Data Engineering - 各式各樣的資料搬移與串接任務
系列文
夥伴們!一起航向AWS Certified Machine Learning Specialty的偉大航道吧!30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言